A Survey of Text Representation and Embedding Techniques in NLP

نویسندگان

چکیده

Natural Language Processing (NLP) is a research field where language in consideration processed to understand its syntactic, semantic, and sentimental aspects. The advancement the NLP area has helped solve problems domains such as Neural Machine Translation, Name Entity Recognition, Sentiment Analysis, Chatbots, name few. topic of broadly consists two main parts: representation input text (raw data) into numerical format (vectors or matrix) design models for processing data. This paper focuses on former part surveys how evolved from rule-based, statistical more context-sensitive learned representations. For each embedding type, we list their representation, issues they addressed, limitations, applications. survey covers history representations 1970s onwards, regular expressions latest vector used encode raw It demonstrates progressed it could comprehend just bits pieces all significant aspects over time.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

eplicitation in interlingual and intralingual translations of shahnameh ferdowsi: a text linguistic approach

بررسی و مقایسه تفاوتها و شباهت های ترجمه ی درون زبانی و برون زبانی با تمرکز بر زبانشناسی متن. برای امر مقایسه میزان بسامد تصریح به کار رفته در ترجمه ی درون زبانی و نیز برون زبانی شاهنامه ی فردوسی مورد بررسی قرار گرفت.

Spell Checking Techniques in NLP: A Survey

Spell checkers in Indian languages are the basic tools that need to be developed. A spell checker is a software tool that identifies and corrects any spelling mistakes in a text. Spell checkers can be combined with other applications or they can be distributed individually. In this paper the authors are discussing both the approaches and their roles in various applications.

متن کامل

ideological and cultural orientations in translation of narrative text: the case of hajji baba of isfahan

در میان عواملی که ممکن است ذهن مترجم را هنگام ترجمه تحت تأثیر قرار دهند، می توان به مقوله انتقال ایدئولوژی از طریق متن یا گفتمان اشاره کرد. هدف از این تحقیق تجزیه و تحلیل جنبه های ایدئولوژیکی و فرهنگی متن مبدأ انگلیسی نوشته جیمز موریه تحت عنوان سرگذشت حاجی بابای اصفهانی ( 1823) و ترجمه فارسی میرزا حبیب اصفهانی(1880) بوده است.

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: IEEE Access

سال: 2023

ISSN: ['2169-3536']

DOI: https://doi.org/10.1109/access.2023.3266377